查看原文
其他

翻译百科|《中国大百科全书》中的“可比语料库”

胡开宝 翻译圈
2024-09-09

01
可比语料库|Comparable corpus


《中国大百科全书》(第三版·网络版)发布了胡开宝教授撰写的“可比语料库”词条。现转录如下,以资交流。


可比语料库可分为单语、双语或多语可比语料库。双语或多语可比语料库一般收录具有可比性但不存在翻译关系的两种或两种以上语言的文本。这种语料库主要应用于语言对比研究。单语可比语料库指由某一种语言的原创文本和翻译文本组成的语料库。单语可比语料库由收录某一语言原创文本的子语料库和收录该语言翻译文本的子语料库组成。其中,该语言的翻译文本译自不同语言。这两个子语料库所涉及的领域、语言变体和时间跨度相似,而且库容也大致相当。如翻译芬兰语语料库(CTF)收录了译自英、俄、德、法等十几种语言的翻译芬兰语文本和芬兰语原创文本,可容总量为960万词,其中翻译芬兰语文本580万词、芬兰语原创文本380万词。

语料的可比性是可比语料库至关重要的特征。语料库的可比性指比较或对比语言或语言变体时所依据的共同标准,是对两种或两种以上语言或语言变体进行比较和对比描述的出发点,是语言或语言变体共同具有的某种属性或范畴。语料的可比性标准通常划分为语外标准和语内标准,语外标准一般包括语料生成或出版的时间跨度、语料的影响力、作者和译者的地位、性别及其影响力等。语内标准通常涵盖语料库的库容、语料的题材、体裁、语料的翻译方向和翻译方式。意大利学者S.拉维奥萨主持建设的英语报纸可比语料库(A Comparable Corpus of English Newspaper Articles) 由《卫报》翻译英语语料子库和《卫报》非翻泽英语语料子库组成,前者库容25879词,后者25832词。葡萄牙里斯本大学的葡萄牙语可比语料库由收录安哥拉、莫桑比克等五个非洲国家葡萄牙语文本的五个语料子库组成,每个子库库容均为60万词。

02
作者简介


胡开宝,男,1966年4月生,中共党员,博士,教授,博士生导师,教育部国家重大人才计划特聘教授。现任上海外国语大学校长助理、语料库研究院院长。曾任上海交通大学外国语学院副院长、常务副院长和院长等。


03
文献来源


原文发表于《中国大百科全书》第三版网络版,欢迎各位学者阅读、分享。

特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。

- END -



翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!


转载来源:《中国大百科全书》(第三版·网络版)

转载编辑:张一孟

审核:吕欣潼、吴志雄

项目统筹:吕欣潼


资讯推荐


ChatGPT技术与翻译研究


▶精品课程

精品课程|刘世界:6节语料库专题课,从入门到精通

精品课程|倒计时5天!实习证明、翻译项目,尽在四周暑期口笔译实习实践竞赛营!

精品课程|ChatGPT提示工程(Prompt Eng.)实践工作坊

精品课程|2023年暑期翻译技术实战研修班重磅来袭

精品课程|ChatGPT辅助翻译质量评估沙龙

精品课程|2023年暑期翻译技术实战研修班

精品课程|ChatGPT时代语料库与术语库建设与应用工作坊

▶翻译百科

翻译百科|《中国大百科全书》中的“法律翻译”

翻译百科|《中国大百科全书》中的“语料库模式分析”

翻译百科|《中国大百科全书》中的“自适应机器翻译”

翻译百科|《中国大百科全书》中的“翻译批评”

翻译百科|《中国大百科全书》中的“统计机器翻译”

翻译百科|《中国大百科全书》中的“翻译规范”

翻译百科|《中国大百科全书》中的“翻译思维”

翻译百科|《中国大百科全书》中的“翻译对等”

翻译百科|《中国大百科全书》中的“翻译隐化”

翻译百科|《中国大百科全书》中的“翻译语料库”

翻译百科|《中国大百科全书》中的“翻译简化”

翻译百科|《中国大百科全书》中的“翻译伦理”

翻译百科|《中国大百科全书》中的“翻译机构”

翻译百科|《中国大百科全书》中的“翻译服务”

翻译百科|《中国大百科全书》中的“基于规则的机器翻译”

翻译百科|《中国大百科全书》中的“语料库翻译学”

翻译百科|《中国大百科全书》中的“翻译技术”

翻译百科|《中国大百科全书》中的“机器翻译”

翻译百科|《中国大百科全书》中的“基于实例的机器翻译”

翻译百科|《中国大百科全书》中的“翻译共性”

翻译百科|《中国大百科全书》中的“机器翻译译后编辑”

翻译百科|《中国大百科全书》中的“翻译记忆”

▶译界动态

译界动态|第二届中英联合翻译学研讨会2号通知

译界动态|李长栓:用ChatGPT解决英译汉中的理解问题

译界动态|ChatGPT时代翻译技术教育创新论坛成功举办

译界动态|AIGC时代翻译教育创新与发展论坛2号通知(含直播通道)

译界动态|从书面到口头:AI口译的挑战与可能性

译界动态|GPT应用场景下语言服务与医学模型技术论坛——暨第六期新译大讲堂

译界动态|今日开讲:“识变应变,数智赋能——人工智能背景下的翻译教育创新发展”系列讲座

译界动态|2023年人工智能的一些顶级趋势

译界动态|王华树 刘世界:数字人文视域下译者数字素养研究:内涵、问题与建议

 关注我们 了解更多

CATTI和MTI资讯

语言服务就业信息

翻译名师真知灼见

翻译学习精品课程


继续滑动看下一个
翻译圈
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存